其他
CUT&Tag 数据处理与分析教程 六:数据可视化
CUT&Tag 数据处理与分析教程 二:质控(不需要修剪 reads!不需要修剪 reads!不需要修剪reads!)和数据比对
CUT&Tag 数据处理与分析教程 三:BAM 文件统计(CUT&Tag 不建议去重不去重不去重)
CUT&Tag 数据处理与分析教程 四:Spike-in 对 CUT&Tag 数据的校正 对数据的校正
CUT&Tag 数据处理与分析教程 五:Peak calling
VII. 可视化
通常,我们感兴趣的是使用基因组浏览器在区域中可视化染色质图谱。IGV ( Integrative Genomic Viewer ) 提供了网页版和本地版进行操作。UCSC Genome Browser 提供了全面的补充基因组信息。
展示标准化后的 bedgraph 文件
图 5:IGV 网页版展示了区间 chr7:131,000,000-134,000,000 上的 修饰情况
特定区域热图可视化
我们也对在注释位点列表中观察感兴趣的染色质特征,例如在基因启动子中的组蛋白修饰信号。我们将使用来自 deepTools 的 computeMatrix 和 plotHeatmap 函数来生成热图。
##== linux 命令 ==##
cores=8
computeMatrix scale-regions -S $projPath/alignment/bigwig/K27me3_rep1_raw.bw \
$projPath/alignment/bigwig/K27me3_rep2_raw.bw \
$projPath/alignment/bigwig/K4me3_rep1_raw.bw \
$projPath/alignment/bigwig/K4me3_rep2_raw.bw \
-R $projPath/data/hg38_gene/hg38_gene.tsv \
--beforeRegionStartLength 3000 \
--regionBodyLength 5000 \
--afterRegionStartLength 3000 \
--skipZeros -o $projPath/data/hg38_gene/matrix_gene.mat.gz -p $cores
plotHeatmap -m $projPath/data/hg38_gene/matrix_gene.mat.gz -out $projPath/data/hg38_gene/Histone_gene.png --sortUsing sum
图 6:基因附近的组蛋白富集热图
CUT&Tag peaks 区域热图
我们使用从 SEACR 返回的 信号区域的中点来对齐热图中的信号。 SEACR 输出的 第六列是 chr:start-end 形式的条目,表示该区域信号最大的区域的开始和结尾位置。我们首先生成一个 包含 6 列中的中点信息的新 bed 文件,并使用 deeptools 来实现热图可视化。
##== linux 命令==##
awk '{split($6, summit, ":"); split(summit[2], region, "-"); print summit[1]"\t"region[1]"\t"region[2]}' $projPath/peakCalling/SEACR/${histName}_${repName}_seacr_control.pe\
aks.stringent.bed >$projPath/peakCalling/SEACR/${histName}_${repName}_seacr_control.peaks.summitRegion.bed
computeMatrix reference-point -S $projPath/alignment/bigwig/${histName}_${repName}_raw.bw \
-R $projPath/peakCalling/SEACR/${histName}_${repName}_seacr_control.peaks.summitRegion.bed \
--skipZeros -o $projPath/peakCalling/SEACR/${histName}_${repName}_SEACR.mat.gz -p $cores -a 3000 -b 3000 --referencePoint center
plotHeatmap -m $projPath/peakCalling/SEACR/${histName}_SEACR.mat.gz \
-out $projPath/peakCalling/SEACR/${histName}_SEACR_heatmap.png \
--sortUsing sum --startLabel "Peak Start" \
--endLabel "Peak End" --xAxisLabel "" \
--regionsLabel "Peaks" \
--samplesLabel "${histName} ${repName}"
图 7:Peak 区域中组蛋白富集热图